Novo tipo de 'modelo de espaço de estado' aproveita os princípios dos osciladores harmônicos.

“Modelos de espaço de estados oscilatórios lineares” utilizam princípios de osciladores harmônicos forçados — um conceito profundamente enraizado na física e observado em redes neurais biológicas. Isso pode aprimorar a forma como prevemos informações complexas, como tendências climáticas ou dados financeiros. Créditos: Imagem: Pixabay
Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) do MIT desenvolveram um novo modelo de inteligência artificial inspirado em oscilações neurais no cérebro, com o objetivo de avançar significativamente como os algoritmos de aprendizado de máquina lidam com longas sequências de dados.
A IA frequentemente tem dificuldades em analisar informações complexas que se desenvolvem ao longo de longos períodos, como tendências climáticas, sinais biológicos ou dados financeiros. Um novo tipo de modelo de IA, chamado "modelos de espaço de estados", foi projetado especificamente para compreender esses padrões sequenciais de forma mais eficaz. No entanto, os modelos de espaço de estados existentes frequentemente enfrentam desafios — podem se tornar instáveis ou exigir uma quantidade significativa de recursos computacionais ao processar longas sequências de dados.
Para abordar essas questões, os pesquisadores do CSAIL, T. Konstantin Rusch e Daniela Rus, desenvolveram o que chamam de "modelos de espaço de estados oscilatórios lineares" (LinOSS), que utilizam princípios de osciladores harmônicos forçados — um conceito profundamente enraizado na física e observado em redes neurais biológicas. Essa abordagem fornece previsões estáveis, expressivas e computacionalmente eficientes, sem condições excessivamente restritivas nos parâmetros do modelo.
"Nosso objetivo era capturar a estabilidade e a eficiência observadas em sistemas neurais biológicos e traduzir esses princípios em uma estrutura de aprendizado de máquina", explica Rusch. "Com o LinOSS, agora podemos aprender interações de longo alcance de forma confiável, mesmo em sequências que abrangem centenas de milhares de pontos de dados ou mais."
O modelo LinOSS é único em garantir uma previsão estável, exigindo escolhas de projeto muito menos restritivas do que os métodos anteriores. Além disso, os pesquisadores comprovaram rigorosamente a capacidade de aproximação universal do modelo, o que significa que ele pode aproximar qualquer função causal contínua que relacione sequências de entrada e saída.
Testes empíricos demonstraram que o LinOSS superou consistentemente os modelos de última geração existentes em diversas tarefas complexas de classificação e previsão de sequências. Notavelmente, o LinOSS superou o modelo Mamba, amplamente utilizado, em quase duas vezes em tarefas envolvendo sequências de comprimento extremo.
Reconhecida por sua importância, a pesquisa foi selecionada para uma apresentação oral no ICLR 2025 — uma honra concedida apenas ao 1% dos melhores trabalhos. Os pesquisadores do MIT preveem que o modelo LinOSS poderá impactar significativamente qualquer área que se beneficie de previsões e classificações precisas e eficientes de longo prazo, incluindo análises de saúde, ciência climática, direção autônoma e previsões financeiras.
"Este trabalho exemplifica como o rigor matemático pode levar a avanços de desempenho e amplas aplicações", afirma Rus. "Com o LinOSS, estamos fornecendo à comunidade científica uma ferramenta poderosa para compreender e prever sistemas complexos, preenchendo a lacuna entre a inspiração biológica e a inovação computacional."
A equipe imagina que o surgimento de um novo paradigma como o LinOSS será de interesse para os profissionais de aprendizado de máquina. Olhando para o futuro, os pesquisadores planejam aplicar seu modelo a uma gama ainda maior de diferentes modalidades de dados. Além disso, eles sugerem que o LinOSS pode fornecer insights valiosos em neurociência, potencialmente aprofundando nossa compreensão do próprio cérebro.
Seu trabalho foi apoiado pela Fundação Nacional de Ciências da Suíça, pelo programa Schmidt AI2050 e pelo Acelerador de Inteligência Artificial do Departamento da Força Aérea dos EUA.